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1. Introduction 

La langue amazighe constitue un element eminent de la culture marocaine et ce, 
par sa richesse et son originalite. Elle a ete negligee sinon ecartee, pour des 
generations, en tant que source d’enrichissement culturel. Cependant, la creation de 
l’lnstitut Royal de la Culture Amazighe (IRCAM), suivie de la 

constitutionnalisation lui a permis desormais de jouir d’un statut meilleur. 
Neanmoins, nous sommes tous conscients que 1’ officialisation n’est pas suffisante 
pour assurer la revitalisation de cette langue, particulierement durant cette ere de 
globalisation et de mondialisation technologique. D’ou la necessite de penser a la 
promotion avec l’esprit des jeunes generations pour qui les Technologies de 
l’lnformation et de la Communication (TIC) sont devenues un support de vie social. 

La notion « Technologies de l’lnformation et de la Communication » couvre un 
vaste eventail de technologies allant des techniques necessaries pour le traitement 
de l’information aux technologies de transmission et de diffusion de cette 
information. A l’ere de la revolution numerique, ces technologies constituent une 
arme a double tranchant : un segment majeur dans la survie d’une langue ou un 
facteur aggravant sa marginalisation. En effet, la predominance des langues des 
pays industrialises risque, si aucun remede n'est pris, d'accentuer dramatiquement 
l’ecart technologique. Toutefois, l'acces aux technologies modernes de 
l'i nf ormation offrira de nouvelles opportunity pour la preservation et la 
revitalisation des langues et cultures regionales. 
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L’amazighe comme la majorite des langues africaines a accumule un retard 
considerable dans ce domaine. D’ou la necessite de le combler a travers des actions 
incitatives de grande ampleur, exploitant les TICs en vue de reajuster et d’accelerer 
la promotion de cette langue. A cette fin, il convient de developper une 
methodologie d’ integration. Cette optique nous amene a reflechir sur l’apport et les 
moyens de l’utilisation des TICs sur le plan des differents axes strategiques de la 
promotion de la langue amazighe : 

- Quelles mesures faut-il prendre pour contribuer a la preservation du 
patrimoine amazighe par le biais des TICs ? 

- Que peut apporter 1’ integration des TICs au processus d’amenagement 
linguistique de 1’ amazighe afin de sauvegarder la diversite linguistique 
marocaine ? 

- Comment les nouvelles technologies peuvent-elles promouvoir 
l’apprentissage de la langue amazighe ? 

- Comment investir dans l’usage social des medias numeriques au profit de la 
langue et la culture amazighes ? 

C’est a ces questions, entre autres, que cet article souhaite apporter des elements de 
reponse. II s’agit de proposer des choix methodologiques et des principes a retenir 
dans le processus de la preservation et de la modernisation de la langue amazighe. 
Nous etayerons notre contribution par des exemples concrets issus de recherches 
recentes dans le domaine des TICs, et plus specifiquement celles en traitement 
automatique des langues qui consiste en la creation d’outils et de ressources 
linguistiques par 1’ integration de fonctionnalites du traitement du langage humain. 

2. L’utilite des TICs pour la perennite de la culture et la langue 
amazighes 

Le developpement et la mondialisation des technologies de 1’ information et de la 
communication offrent a toutes les langues du monde un espace globalise de 
communication et d’echange. Dans cette perspective, nous introduisons quelques 
retombees de 1’ exploitation des TICs pour 1’ amazighe. 

2.1. Les TICs au service de la sauvegarde du patrimoine amazighe 

La langue amazighe comme toute langue africaine dite de tradition orale, dont le 
patrimoine culturel, scientifique et historique ne se transmettait de generation en 
generation qu’a travers la memoire et les traditions, ce qui l’a menacee de la 
destruction des particularites de sa culture et de son identite nationale. D’ou 
l’interet de recenser 1’ ensemble des elements patrimoniaux et de pouvoir gerer leur 
aspect descriptif via une banque de donnees multimedias evolutive repondant a un 
double objectif de conservation et de valorisation de ce patrimoine vernaculaire. En 
effet, 1’ elaboration d’une telle banque de donnees numerique resoudra le probleme 
de la conservation et contribuera a assurer la perennite de cet heritage ancestral 
sous une forme perceptible d’une part et d’autre part refletera la richesse et la 
diversite de ce patrimoine tout en garantissant une bonne structuration de ses 
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composants materiels et immateriels, une meilleure accessibility universelle et une 
resurrection de l’interet du grand public. 

A cette fin. une etape de numerisation est indispensable pour la creation de cet 
espace culturel, suivie d’une phase d’archivage sous un format standard permettant 
la structure du contenu brut et des metadonnees necessaries a la gestion. Cette 
phase repose sur un ensemble d’outils et de methodes de traitement automatique 
des langues, a savoir : 

- Le transcodage pour en faire un contenu intelligible dont le codage est 
particulierement compatible aux evolutions technologiques ; 

- L’indexation qui sert a identifier et selectionner les metadonnees pertinentes 
decrivant le contexte patrimonial ; 

- La classification pour regrouper et classer ce contenu numerique selon le 
support, le type, le theme et la region. 

Par ailleurs, afin de permettre une exploitation effective de ce contenu et de 
diversifier les supports de stockage, une demarche de transcription automatique ou 
d’ocerisation est essentielle a entreprendre pour accelerer la conversion des 
archives audio et image en documents sous format texte, suivie par la 
translitteration afin de permettre d’ unifier la graphie utilisee pour representer le 
contenu. 

2.2. Les TICs au service de l’amenagement linguistique de 
l’amazighe 

Apres des decennies de negligence, la creation de l’lnstitut Royal de la Culture 
Amazighe a motive la revitalisation de la langue amazighe par un processus 
d’amenagement linguistique qui englobe un eventail d’approches, y compris la 
codification graphique, l’etablissement de regies d’orthographe, de grammaire et 
de lexiques, la terminologie et la traduction. 

La reussite d’un amenagement linguistique depend de sa visibility. C’est pourquoi 
1’ utilisation des TICs constitue de nos jours un levier dans ce processus permettant 
de valoriser les efforts fournis et d’agir sur les presentations linguistiques et ce, a 
travers : 

- L’internet pour contribuer a la diffusion des productions de recherche et 
faciliter l’echange des connaissances et le suivi de T evolution du processus 
d’amenagement linguistique pour d’autres langues dans des situations 
similaires. 

- La codification graphique qui definit une norme standard et une police de 
caracteres adequate de la graphie afin d’ assurer 1’ exploitation et le partage 
des contenus. 

- La gestion des ressources linguistiques a savoir les corpus, les lexiques et la 
terminologie, dont le developpement est hautement interdisciplinaire, exige 
la cooperation de specialistes de nombreux domaines. Etant donne la 
quantite considerable de ressources linguistiques et le nombre de personnes 


35 



Fadoua Ataa Allah & Siham Boulaknadel 


qui devraient travailler ensemble en unissant leurs efforts ainsi que leurs 
ressources, les bases de donnees presentent un outil essentiel de gestion et de 
structuration dans le processus d’amenagement linguistique. 

- L’ extraction automatique de terminologie qui permettra 1’ attestation des 
termes dans differents genres textuels et l’enregistrement de l’usage des 
termes en contextes, et ce en exploitant la richesse des ressources 
langagieres telles que les corpus textuels. 

- La traduction automatique qui assurera une meilleure comprehension entre 
des locuteurs de langues differentes et contribuera a la diffusion de la culture 
a l’echelle internationale en utilisant des outils d’ analyse, de generation et de 
transfert a l’aide des corpus multilingues. 

2.3. Les TICs au service de l’enseignement 

Malgre 1’ initiative tres significative de 1’ integration de l’amazighe au sein du 
systeme educatif marocain en 2003, elle n’est toujours pas suivie de faits concrets 
permettant a cette langue d’atteindre le niveau de l’arabe ou du franqais. Pour 
tenter de remedier a cet etat de fait, l’application des TICs a l’enseignement est une 
solution primordiale pour notre communaute pour accelerer les echanges de savoir 
et reduire le retard accumule dans ce domaine. 

Dans une situation dominee par l’insuffisance du nombre des enseignants et 
formateurs et du materiel pedagogique adapte, ainsi que par la restriction de 
1’ experience aux classes primaires et a un certain nombre limite d’etablissements, il 
est judicieux de pouvoir profiter suffisamment des retombees de 1’ utilisation des 
TICs au profit de 1’ education a travers : 

- L’apprentissage en ligne qui presentera une piste pertinente pour favoriser la 
promotion des ressources humaines et la generalisation verticale et 
horizontale, en resolvant le manque de formateurs par le rassemblement des 
enseignants disperses a travers le pays ; 

- Les outils multimedias et d’interactivite qui encourageront l’apprentissage 
autodirige par la garantie de la correction informatisee, faciliteront la 
creation et amelioreront la qualite des contenus educatifs tout en assurant la 
transmission du savoir porteur de la diversite des formes d’ expression 
culturelle ; 

- L’enseignement hybride base sur la conjonction des activites en ligne et en 
classe qui permettra de favoriser le potentiel motivationnel des apprenants et 
d’ameliorer la qualite de l’enseignement ; 

- Un reseau professionnel d’ enseignants qui facilitera l’echange du savoir et le 
debat autour des besoins educationnels et des utilitaires de production 
d’ outils pedagogiques. 

Dans cette perspective, il est important de pouvoir recenser les mecanismes et les 
techniques necessaires pour mener a bien la generalisation de cette vocation et la 
mise en place d’une plate-forme d'apprentissage en ligne assurant la modernisation 
des moyens pedagogiques, l'elargissement du savoir ainsi que le partage des 
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connaissances et favorisant l’emergence d'un enseignement de qualite. Toutefois, 
1’ elaboration d’une telle plate-forme depend principalement du contenu 
pedagogique, dont les supports du cours sont necessairement accompagnes par des 
activites pedagogiques dont la linguistique computationnelle constitue un 
fondement important, et ce par : 

- L’ exploitation de la richesse des ressources langagieres telles que les corpus 
textuels a travers des concordanciers permettant 1’ exploration de la diversite 
des situations langagieres et 1’ extraction d’exemples authentiques dans le but 
d’etudier le sens et les regies d’emploi ; 

- L’utilisation de correcteurs orthographique et grammatical facilitant 
l’apprentissage autodirige en assurant l’automatisation de 1’ analyse des 
productions des apprenants ; 

- L’ exploitation des correcteurs phonetiques pour soutenir 1’ acquisition de la 
prononciation a Pavers des entramements systematiques. 

2.4. Les TICs au service des medias 

Les technologies de 1’ information et de la communication, principalement 
1’ internet, ont permis de diffuser plus efficacement les moyens de communication 
et d’ameliorer le traitement, la mise en memoire, la diffusion et l’echange de 
l’information. Neanmoins, cette emergence a suscite une mutation technique des 
medias classiques (television, radio, presse, cinema) aux niveaux de leurs chames 
de valorisation allant de la production jusqu’ a la consommation de l’information, et 
ce a travers le passage de l’analogique au numerique et le developpement des 
techniques du traitement de l’information, qu’elle soit ecrite, orale ou multimedia, 
monolingue ou multilingue pour selectionner, classer, structurer et rechercher. 

Cependant, la place de l’amazighe dans les principaux medias a toujours ete et 
reste tres limitee. Dans la perspective de faire face a ce defi et de faire de 
l’amazighe une langue de communication, il faudrait, d’une part, adopter les outils 
multimedias pour valoriser et renover son contenu mediatique et, d’ autre part, 
exploiter les differentes plate-formes de diffusion comme les sites Web, les 
seminaires et les plate-formes de video en ligne, les medias sociaux et les blogues 
pour une presentation attrayante de ce contenu. 

3. Methodologie pour 1’ informatisation de l’amazighe 

Dans l’objectif de concretiser l’apport des TICs aux differents axes strategiques de 
l’lnstitut, nous avons mene une etude pour 1’ elaboration d’une methodologie de 
mise en oeuvre assurant la revitalisation et la promotion de la langue amazighe. 
Cette methodologie repose sur les travaux elabores pour 1’ informatisation des 
langues peu dotees (Berment, 2004 ; Scanned et al., 2012) ainsi que sur une 
cartographic des differents traitements et ressources disponibles pour des langues 
peu, moyennement et bien dotees (Ataa Allah, 2010), afin de definir les priorites 
permettant de planifier une feuille de route dotant l’amazighe d’ outils assurant son 
fonctionnement comme les langues conformement equipees (Ataa Allah et 
Boulaknadel, 2012). 
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La methodologie proposee structure le developpement du projet de 
1’ informatisation de l’amazighe en taches fondamentales, conques d’une maniere a 
ce qu’elles se deroulent en trois periodes (courte, moyenne et longue) qui peuvent 
s’etendre sur 5 a 10 ans selon la disponibilite humaine et les ressources 
linguistiques. Ces taches sont representees par une chaine qui part des traitements 
elementaires allant vers des applications generiques repondant generalement a des 
besoins et passant par la constitution de briques de ressources linguistiques (Figure 
ci-dessous). Cette chaine va de 1’ adaptation et l’amelioration d'outils en fonction 
des nouvelles technologies jusqu’au developpement d’ applications, en se basant sur 
la recherche fondamentale. 
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3.1. La phase a court terme 

Cette phase constitue une premiere etape dans le processus de 1’ informatisation de 
l’amazighe. Elle est initiee par un codage de caracteres, un clavier et des polices de 
caracteres, assurant la constitution de ressources electroniques telles que les bases 
de donnees lexicales et vocales, les corpus de recherche d’ information, brut et 
annote morpho-syntaxiquement. Ces ressources servent de briques elementaires 
pour F elaboration d’outils et d’ applications du traitement du langage humain, en 
particulier celles planifiees pour cette phase, a savoir la normalisation, la 
segmentation, la pseudo-racinisation, le concordancier de base, le moteur de 
recherche, le conjugueur et le systeme de reconnaissance optique de caracteres. 

3.2. La phase a moyen terme 

Apres avoir etabli les ressources de base et les outils fondamentaux, cette phase 
repose sur un traitement linguistique qui consiste en une realisation d’une 
racinisation, une lemmatisation, un etiquetage morpho-syntaxique automatique, 
une analyse morphologique, partielle et syntaxique, et une reconnaissance de la 
parole. Ces traitements permettront de developper des applications avancees telles 
qu'un correcteur orthographique, une plate-forme d’ apprentissage en ligne, un 
extracteur terminologique, un moteur de recherche et un concordancier avances 
ainsi qu’un generateur de textes. En outre, cette phase represente une etape clef de 
preparation des ressources necessaires pour la prochaine etape, y compris les bases 
de donnees enrichies, les dictionnaires multilingues, et les corpus alignes et annotes 
semantiquement. 

3.3. La phase a long terme 

La troisieme etape de la feuille de route pourrait etre consideree comme une 
synthese du travail realise. A cote d’un traitement de phonetisation et d’une 
elaboration d’une ontologie, d’un developpement d’un desambiguiseur semantique 
et d’un synthetiseur de la parole, cette phase se concentre egalement sur la 
realisation d’ applications multilingues, principalement la traduction automatique. 

4. Strategies technologiques a respecter 

Dans la perspective de mener a bien le developpement de ressources et d’outils 
necessaires pour 1’ informatisation d’une langue, des etudes ont porte sur des 
strategies technologiques qui devraient etre respectees. Ainsi, nous nous sommes 
inspirees des travaux de Muhirwe (Muhirwe, 2007) qui suggere de prendre en 
consideration lors du developpement des applications la notion d’extensibilite et de 
documentation ainsi que 1’ adoption des technologies libres, pour dresser nos 
strategies de developpement prealablement necessaires pour reussir et accelerer le 
processus de 1’ informatisation de l’amazighe. 
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4.1. Standardisation des ressources 

L’ elaboration des ressources numeriques est une etape indispensable dans tout 
processus d’ informatisation. Cependant, cette tache est couteuse en termes de 
temps et de competences humaines. D’ou l’utilite de les concevoir sous un format 
standard permettant a la communaute academique impliquee dans la realisation ou 
l'integration d’outils et ressources, de jouir d’un environnement garantissant la 
gestion et l'interoperabilite entre de tels composants. 

4.2. Adaptation des technologies de langues 

Une part serieuse du temps et d’ efforts necessaires pour informatiser une langue est 
generalement consacree a la realisation de 1’ environnement. Cependant, cette tache 
laborieuse peut etre optimisee par l’integration et l’adaptation des techniques 
existantes afin de profiter pleinement du potentiel qu'offrent ces technologies pour 
la realisation des taches de maniere generique sans avoir recours a « reinventer la 
roue ». 


4.3. Extensibilite 

L'extensibilite est un facteur elementaire dans la conception de tout projet en 
technologie des langues, assurant l'extension de ses fonctionnalites. Cette propriete 
permet une plus grande reutilisabilite du projet en facilitant l’ajout de nouveaux 
composants et l’amelioration ou l’adaptation de l’existant. 

4.4. Logiciels libres 

En vue de garantir 1’ adaptation des technologies de langues et leur extensibilite, il 
est necessaire d’ adopter un mode de conception et d’ exploitation qui obeit a des 
regies de liberte susceptible d'etre soumis a modification et redistribution sans 
restriction. Ces caracteristiques conferent une certaine fiabilite et reactivite. 

4.5. Documentation 

La documentation constitue l’une des pierres angulaires dans le developpement 
d’un projet d’ informatisation d’une langue. Elle permet d’expliquer le 
fonctionnement du projet en determinant ses objectifs, son architecture ou sa 
conception, les techniques utilisees pour son developpement et son manuel 
d’ utilisation. Ce qui peut assurer sa bonne exploitation, son extensibilite et sa 
reutilisation logicielle. 

4.6. Evaluation des systemes 

Le recours a 1’evaluation conduit a repenser les objectifs, les pratiques, voire les 
approches theoriques. Une evaluation peut etre apportee avant la mise en oeuvre 
d’un systeme, pour determiner a l’aide d’un diagnostic les objectifs attendus et les 
indicateurs necessaires a 1’ evaluation ; au cours de sa realisation, afin d’ajuster le 
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systeme au besoin a travers une serie d’ evaluations progressives ; ou apres 
1’ achievement du travail, et ce pour determiner le niveau de satisfaction, la 
pertinence, la durabilite et l'extensibilite du systeme. 

Par ailleurs, deux types d’ evaluation sont distingues : 

- L’ evaluation objective fournit une mesure des performances du systeme en 
dehors de toute consideration sur sa perception par les utilisateurs. 

- L’evaluation subjective fondee sur le jugement des utilisateurs et qui 
consiste a mesurer 1’ adequation du systeme a la tache ainsi que son utilite en 
termes de convivialite, fiabilite et facilite d’ utilisation. 

5. Realisations 

Dans le cadre de la promotion de la langue amazighe, de nombreux travaux ont ete 
realises afin de fournir a cette langue des ressources et outils permettant son 
traitement automatique et son integration dans le domaine des technologies de 
l'information et de la communication. 

Cette section introduit les differentes realisations au niveau national 1 en les 
structural en sept parties selon la nature du traitement vise, passant par le 
prealable a l’exploitation des TICs ; outils de recherche, d’analyse et d’assistance ; 
ressources langagieres, localisation logicielle et reconnaissance optique des 
caracteres. 

5.1. Prealables a l'exploitation des TICs 

En amont de l’exploitation des TICs dans le processus de la promotion de 
l’amazighe, il faut disposer de donnees numerisees. A cette fin, il est judicieux de 
definir un codage adapte, un clavier et des polices de caracteres. 

5.1.1. Codage de Tifinaghe 

Le codage du caractere tifinaghe constitue le premier pas vers l’exploitation des 
TICs, permettant la transcription de l’amazighe a travers une representation 
numerique pour chaque caractere. Ce processus s’ est deroule en deux etapes : la 
premiere a consiste en une adaptation de la norme ISO 8859-1 pour coder les 
caracteres tifinaghes en codage ANSI, afin de repondre a l’urgence de 
1’ introduction de l’amazighe dans le systeme educatif. Cependant, la portee de ce 
codage prive de TIRCAM a ete limitee, et la gestion des textes comportant 
plusieurs systemes d'ecriture etait difficile. D’ ailleurs, les traitements des textes 
multilingues doivent jongler a la fois avec les differentes normes de codage et avec 
les polices associees. D’ou la necessite et l’importance d’integrer le tifinaghe dans 
le plan multilingue c’est-a-dire un codage plus portable et facile a gerer tel que 
1’ Unicode qui a permis d'affecter un code unique a chaque caractere (Andries, 
2008). 


1 Dans cet article, nous nous sommes limitees au niveau national, neanmoins les realisations 
au niveau international pourront faire l’objet d’une autre contribution. 
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5.1.2. Clavier 

L’integration de l’amazighe dans la norme internationale de la prescription des 
claviers ISO/CEI 9995 a fixe definitivement les claviers de la langue amazighe 
con 5 us pour la bureautique. En fait, cette norme a specific deux types de claviers : 
un clavier de base contenant les caracteres tifinaghes preconises par 1’IRCAM et un 
clavier etendu comportant tous les caracteres adoptes par 1’ISO. 

5.1.3. Polices de caracteres 

Dans l’objectif d’integrer la langue amazighe dans le systeme educatif et de 
favoriser la publication assistee par ordinateur, huit polices de caracteres, associees 
au codage ANSI, ont ete realisees. Cette realisation a ete suivie par l’elaboration 
d'une nouvelle generation de polices, qui a constitue un saut qualitatif de 
l’universalisation de l’ecriture amazighe. Cette generation inclut les polices 
associees a 1’ Unicode. 

5.1.4. Convertisseur 

Des l’encodage Unicode des caracteres tifinaghes, il a fallu preparer des outils pour 
convertir la representation de ces caracteres d’un codage a un autre. Par ailleurs, 
dans la perspective de promouvoir la langue amazighe et d’ assurer la sauvegarde 
de son heritage litteraire, il apparait interessant de tirer profit des productions 
amazighes ecrites en caracteres arabe et latin. A cette fin, un convertisseur a ete 
realise, permettant le passage du codage ANSI au codage Unicode et la 
transliteration du caractere arabe et du caractere latin au caractere tifinaghe (Ataa 
Allah et al, 2013). 

5.2. Outils de recherche 

Dans la perspective de contribuer a la diffusion de la langue et de la culture 
amazighes, il est interessant de developper des applications d’ exploration et de 
recherche. 

5.2.1. Moteur de recherche 

Les moteurs de recherche sont actuellement la premiere source d’ information sur le 
Web pour plusieurs domaines et leur utilisation est devenue incontournable. 
D’ailleurs, les sondages et enquetes qualitatives effectues en la matiere demontrent 
bien 1’ importance de ces applications qui repondent aux besoins professionnels et 
personnels suscites par les internautes 2 . 

Conscients de ce fait et afin de contribuer a la promotion et la diffusion de la 
culture et la langue amazighes a travers le Web et d’assister les internautes a 
decouvrir la diversite et la richesse de la culture amazighe, un moteur de recherche 
supportant la graphie tifinaghe a ete developpe (Ataa Allah et Boulaknadel, 2010a). 


2 http://www.nielsen-online.com/pr/pr_040223_us.pdf 
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Ce dernier est base sur un ensemble de traitements linguistiques, a savoir, 
1’ elimination des mots anti-dictionnaires 3 et 1’ exploitation de la pseudo-racinisation. 

5.2.2. Concordancier 

Les concordances sont un mode de presentation d’ extraits de texte, contenant le 
meme mot ou le meme motif linguistique, basees sur une methodologie d’analyse 
textuelle laborieuse. Cependant, le recours aux outils de concordance numerique a 
facilite cette tache seculaire que necessitaient les concordances manuelles. Dans 
cette perspective, un outil de concordance supportant les scripts arabes, latins et 
Unicode de l’amazighe a ete developpe. II permet d’effectuer des recherches dans 
des textes numeriques et repond au besoin d’exploration suscite par l'usager dans 
le but d’etudier le sens et les regies d’emploi (Ataa Allah et Boulaknadel, 2010a). 

5.3. Outils d’analyse 

Afin de doter l’amazighe d’ outils d’analyse et de generation, un ensemble de 
travaux portant sur la morphologie flexionnelle et derivationnelle a ete effectue. 

5.3.1. Pseudo-racineur 

L’outil de pseudo-racinisation est base sur une approche relevant du cas de la 
morphologie flexionnelle et reposant sur 1’ elimination d’une liste de suffixes et de 
prefixes de la langue amazighe dans un ordre predetermine. Cette approche legere 
permettant de regrouper les mots semantiquement proches a partir de 
ressemblances pourra etre facilement exploitee dans des applications telles que la 
recherche d’information et la classification (Ataa Allah et Boulaknadel, 2010b). 

5.3.2. Conjugueur 

Dans un contexte de developpement d’ outils de generation pour la langue 
amazighe, un conjugueur a ete realise pour faciliter l’apprentissage de la langue. 
Cet outil est conqu a la base de modeles de comportement flexionnel augmente de 
regies de regularisation morphologiques (Laabdelaoui et al., 2012). II permet la 
conjugaison en ligne des formes verbales simples et derivees dans differents 
aspects et modes de l’amazighe. 

5.3.3. Analyseur morphologique 

Etant donne que toute analyse linguistique passe par une premiere etape d’analyse 
morpho-lexicale, qui consiste a tester l’appartenance de chaque mot du texte au 
lexique de la langue, il a ete entrepris de developper des systemes d’analyse 
morphologique pour l’amazighe, profitant des apports des modeles a etats finis et 
faisant appel a une formalisation du vocabulaire et a des regies grammaticales a 


3 Les mots non significatifs ou non discriminants pour la recherche d'information, tels que 
les prepositions, les conjonctions et les determinants. 
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large couverture. Un premier systeme a ete developpe a la base de l’environnement 
linguistique NooJ. II s’est focalise essentiellement sur la formalisation flexionnelle 
et derivationnelle de la categorie nom (Nejme et al., 2013). Cependant, le 
deuxieme systeme a ete realise en exploitant l’environnement de developpement 
Xerox en se basant principalement sur la formalisation flexionnelle de la categorie 
verbe (Ataa Allah, 2014). 

5.4. Ressources langagieres 

La realisation de ressources langagieres (jeux d’ etiquettes, dictionnaires, 
terminologies, corpus oraux et ecrits,...) est une activite de mise en oeuvre 
d'infrastructures qui doit etre perque a un niveau amont etant donne, d’une part, le 
cout prohibitif d'une telle tache, et d’ autre part le fait de constituer un pre-requis 
indispensable pour le developpement des applications de technologie de langue a 
haute valeur ajoutee. 

5.4.1. Jeux d’etiquettes morpho-syntaxiques 

Dans la perspective d’ annotation de corpus amazighe, un jeu d’etiquettes morpho- 
syntaxiques a ete elabore a la base de la Nouvelle grammaire de 1’ cimcizighe 
(Boukhris et al . , 2008). Ce jeu s’inspire du projet EAGLES 4 oil le choix des 
etiquettes repose sur une distinction entre etiquettes obligatoires, etiquettes 
recommandees et extension particuliere. Ainsi, il est propose deux listes 
d’etiquettes specifiques aux caracteristiques de l’amazighe. L’une contient les 
etiquettes obligatoires ; l'autre, des etiquettes recommandees fournissant des 
indications plus precises (Ataa-Allah, 2011). 

5.4.2. Dictionnaire 

Dans la perspective d’appuyer l’enseignement et l’apprentissage de 1’ amazighe, un 
dictionnaire imagier sonore en ligne a ete conqu pour les enfants ages de 2 a 14 ans 
(Ataa Allah, 2011). II se base sur l’interaction entre les connaissances linguistiques 
et extralinguistiques afin d’offrir a 1’ enfant un simple moyen pour stimuler son 
langage et son eveil. Ce dictionnaire comporte actuellement 550 entrees lexicales 
reparties sur 105 categories regroupees en 18 thematiques. Chaque entree est 
determinee par 4 langues (anglais, amazighe, arabe, franqais) et representee par une 
image et un son. 

5.4.3. Terminologie 

Dans l’objectif de doter l’amazighe d’une terminologie couvrant le plus grand 
nombre de champs lexicaux, une base de donnees terminologiques a ete elaboree. 
Elle comporte des entrees terminologiques relevant de plusieurs thematiques, y 
compris les lexiques usuels, des medias et grammaticaux ainsi que leurs 
equivalents arabes et franqais (El Azrak et El Hamdaoui, 2011). 


4 http://www.ilc.cnr.it/EAGLES96/annotate/annotate.html 
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5.4.4. Corpus 

Dans l’objectif de developper des outils de traitement automatique de l’amazighe et 
pour pouvoir se fonder sur l’usage reel de la langue, un recueil de textes numerises 
et codes a ete realise. 

• Corpus brut 

Dans le cadre d’ elaboration de corpus electronique pour la langue amazighe, 
un corpus a ete collecte, compose de 160 textes amazighes representant 
differents genres litteraires, a savoir conte, conte pour enfants, poesie et 
articles de presse contenant les sous-genres journal, magasine et Net. II 
comprend 136.093 occurrences dont 23.174 sont des mots distincts 
(Boulaknadel et Ataa Allah, 2011). 

• Corpus etiquete 

Les ressources lexicales annotees ne sont que rarement disponibles, 
particulierement pour les langues peu dotees telle que l’amazighe. Dans ce 
contexte, une demarche d’ elaboration de corpus etiquete a ete menee. Ainsi, le 
corpus realise comprend environ 20 k mots et se compose de textes extraits 
d'une variete de sources telles que la version amazighe du site Web de 
l'IRCAM, le periodique « Inghmisn n usinag » (bulletin d’ information de 
1’IRCAM) et des manuels scolaires (Outahajala et ai, 2010). 

5.5. Outils d’assistance 

Dans l’objectif de faciliter et de mener a bien le processus d’ elaboration de 
ressources langagieres, des applications d’assistance ont ete realisees. 

5.5.1. Base de donnees lexicales 

Bien que de nombreux dictionnaires papiers de la langue amazighe soient edites, 
aucune base de donnees numerique n’est disponible. Pour faire face a ce manque, 
une application assurant la gestion des collectes et 1’ exploration des lexiques 
amazighes a ete elaboree. Cette application permet de structurer les informations 
intra et inter-lexicales telles que la definition, les equivalents arabes et fran 5 ais, les 
synonymes et le classement par themes (Iazzi et Outahajala, 2008). 

5.5.2. Outil d’assistance a l’etiquetage morpho-syntaxique 

L’utilisation des corpus, notamment ceux annotes morpho-syntaxiquement, est 
devenue une etape indispensable dans un processus d’ informatisation d’une langue. 
Cependant, cette tache est d’une grande complexity et son cout en termes de temps 
et de ressources humaines limite la quantite et la disponibilite des corpus. Afin de 
minimiser les efforts necessaries pour produire des corpus amazighes et 
d’ameliorer leurs qualites en permettant des verifications et en simplifiant les 
modifications et les mises a jour, un outil d’assistance a l’etiquetage morpho- 
syntaxique a ete developpe, permettant une automatisation partielle de la tache 
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d’etiquetage et assurant une bonne coherence entre les different^ travaux realises 
par 1’ ensemble des chercheurs (Ataa Allah et Jaa, 2009). 

5.5.3. Base de donnees litteraires 

Dans une perspective de sauvegarde du patrimoine litteraire amazighe, une 
application visant la collecte et la mise en reseau d’un noyau d’une banque de 
corpus litteraires, contenant principalement des donnees textuelles et audiovisuelles 
amazighes, a ete developpee. Cette application permet la gestion et la consultation 
du contenu litteraire (Ait Ouguengay et al., 2012). 

5.6. Localisation logicielle 

A travers la localisation de l’interface de deux cellulaires Sony Ericsson « JllOi et 
J120i » et du systeme d’ exploitation Microsoft « Windows 8 », une opportunity a 
ete offerte a 1’ amazighe pour assurer sa presence dans le monde technologique et 
offrir a l’utilisateur un environnement familier, oil T experience de l’integration de 
la langue amazighe et son systeme d’ecriture tifinaghe a ete menee. 

5.7. Reconnaissance optique des caracteres 

Dans une vision de contribuer a la sauvegarde et la numerisation du fonds 
documentaire amazighe, de nombreuses etudes ont ete menees sur la 
reconnaissance optique de caracteres amazighes dont le taux de reconnaissance est 
autour de 92%. Ces etudes se basent sur differentes approches pour la 
reconnaissance du caractere imprime et manuscrit. Elies sont regroupees 
generalement en trois classes, a savoir les reseaux de neurones (Ait Ouguengay, 

2009) , (Elyachi et al., 2009), une approche syntaxique fondee sur les automates a 
etats finis (Es Saady et al., 2010) et les modeles de Markov caches (Amrouch et al., 

2010 ) . 

6. Conclusion 

Dans un contexte general visant la perennite et la promotion de la langue amazighe, 
les TICs constituent une piste prometteuse pour lutter contre la fracture numerique 
dont 1’ amazighe a souffert. Dans cette perspective, le present article propose une 
methodologie d’ informatisation de T amazighe pour agir de fa 5 on ciblee et efficace 
dans quatre domaines clefs, a savoir la sauvegarde du patrimoine, l’amenagement 
linguistique, 1’ education et les medias. Le fait de mettre T accent sur ces domaines 
permettra de donner aux Marocains les moyens de s’epanouir en amazighe comme 
en arabe et en fran 5 ais et de contribuer au devleppoment de la societe. Cette 
methodologie se base sur les travaux elabores pour 1’ informatisation des langues 
peu dotees et suit un plan de developpement en trois etapes partant de la realisation 
d'un kit d’outils et de ressources linguistiques minimaux jusqu’a 1’ elaboration 
d’ applications avancees. En outre, 1’ article dresse un bilan de realisation d’outils et 
de ressources linguistiques amazighes permettant son traitement automatique et son 
integration dans le domaine des TICs. 
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